觀察過去二十年(民國86年-105年/1997-2016)台灣人最常去的地方

Step 1. 將大由下載的資料依照年份分好,觀察過去20年的資料

library(readr)
## Warning: package 'readr' was built under R version 3.4.2
library(dplyr)
## Warning: package 'dplyr' was built under R version 3.4.2
## 
## Attaching package: 'dplyr'
## The following objects are masked from 'package:stats':
## 
##     filter, lag
## The following objects are masked from 'package:base':
## 
##     intersect, setdiff, setequal, union
TW105 <- read_csv("C:/Users/user/Desktop/R/Final Project/TW 86-105/TW105.csv")
## Parsed with column specification:
## cols(
##   Year = col_integer(),
##   Location = col_character(),
##   `number of visitors` = col_integer()
## )
TW105 <- arrange(TW105,desc(`number of visitors`))
## Warning: package 'bindrcpp' was built under R version 3.4.2
top10_TW105 <- TW105 [c(1:10),]

TW104 <- read_csv("C:/Users/user/Desktop/R/Final Project/TW 86-105/TW104.csv")
## Parsed with column specification:
## cols(
##   Year = col_integer(),
##   Location = col_character(),
##   `number of visitors` = col_integer()
## )
TW104 <- arrange(TW104,desc(`number of visitors`))
top10_TW104 <- TW104 [c(3,4,5,7,10,11,12,13,14,15),]

TW103 <- read_csv("C:/Users/user/Desktop/R/Final Project/TW 86-105/TW103.csv")
## Parsed with column specification:
## cols(
##   Year = col_integer(),
##   Location = col_character(),
##   `number of visitors` = col_integer()
## )
TW103 <- arrange(TW103,desc(`number of visitors`))
top10_TW103 <- TW103 [c(3,4,5,7,10,11,12,13,14,15),]

TW102 <- read_csv("C:/Users/user/Desktop/R/Final Project/TW 86-105/TW102.csv")
## Parsed with column specification:
## cols(
##   Year = col_integer(),
##   Location = col_character(),
##   `number of visitors` = col_integer()
## )
TW102 <- arrange(TW102,desc(`number of visitors`))
top10_TW102 <- TW102 [c(3,4,5,7,8,9,11,13,14,15),]

TW101 <- read_csv("C:/Users/user/Desktop/R/Final Project/TW 86-105/TW101.csv")
## Parsed with column specification:
## cols(
##   Year = col_integer(),
##   Location = col_character(),
##   `number of visitors` = col_integer()
## )
TW101 <- arrange(TW101,desc(`number of visitors`))
top10_TW101 <- TW101 [c(3,4,6,8,9,11,12,13,14,17),]

TW100 <- read_csv("C:/Users/user/Desktop/R/Final Project/TW 86-105/TW100.csv")
## Parsed with column specification:
## cols(
##   Year = col_integer(),
##   Location = col_character(),
##   `number of visitors` = col_integer()
## )
TW100 <- arrange(TW100,desc(`number of visitors`))
top10_TW100 <- TW100 [c(3,4,6,7,10,11,12,13,16,17),]

TW99 <- read_csv("C:/Users/user/Desktop/R/Final Project/TW 86-105/TW99.csv")
## Parsed with column specification:
## cols(
##   Year = col_integer(),
##   Location = col_character(),
##   `number of visitors` = col_integer()
## )
TW99 <- arrange(TW99,desc(`number of visitors`))
top10_TW99 <- TW99 [c(3,4,6,7,10,11,12,13,14,15),]

TW98 <- read_csv("C:/Users/user/Desktop/R/Final Project/TW 86-105/TW98.csv")
## Parsed with column specification:
## cols(
##   Year = col_integer(),
##   Location = col_character(),
##   `number of visitors` = col_integer()
## )
TW98 <- arrange(TW98,desc(`number of visitors`))
top10_TW98 <- TW98 [c(3,4,6,7,10,11,12,13,16,17),]

TW97 <- read_csv("C:/Users/user/Desktop/R/Final Project/TW 86-105/TW97.csv")
## Parsed with column specification:
## cols(
##   Year = col_integer(),
##   Location = col_character(),
##   `number of visitors` = col_integer()
## )
TW97 <- arrange(TW97,desc(`number of visitors`))
top10_TW97 <- TW97 [c(3,4,6,10,11,12,13,16,17,18),]

TW96 <- read_csv("C:/Users/user/Desktop/R/Final Project/TW 86-105/TW96.csv")
## Parsed with column specification:
## cols(
##   Year = col_integer(),
##   Location = col_character(),
##   `number of visitors` = col_integer()
## )
TW96 <- arrange(TW96,desc(`number of visitors`))
top10_TW96 <- TW96 [c(2,3,4,6,8,9,10,12,13,14),]

TW95 <- read_csv("C:/Users/user/Desktop/R/Final Project/TW 86-105/TW95.csv")
## Parsed with column specification:
## cols(
##   Year = col_integer(),
##   Location = col_character(),
##   `number of visitors` = col_integer()
## )
TW95 <- arrange(TW95,desc(`number of visitors`))
top10_TW95 <- TW95 [c(2,3,4,6,7,8,11,12,13,14),]

TW94 <- read_csv("C:/Users/user/Desktop/R/Final Project/TW 86-105/TW94.csv")
## Parsed with column specification:
## cols(
##   Year = col_integer(),
##   Location = col_character(),
##   `number of visitors` = col_integer()
## )
TW94 <- arrange(TW94,desc(`number of visitors`))
top10_TW94 <- TW94 [c(2,3,4,6,7,10,11,12,13,14),]

TW93 <- read_csv("C:/Users/user/Desktop/R/Final Project/TW 86-105/TW93.csv")
## Parsed with column specification:
## cols(
##   Year = col_integer(),
##   Location = col_character(),
##   `number of visitors` = col_integer()
## )
TW93 <- arrange(TW93,desc(`number of visitors`))
top10_TW93 <- TW93 [c(2,3,4,6,7,9,10,11,13,14),]

TW92 <- read_csv("C:/Users/user/Desktop/R/Final Project/TW 86-105/TW92.csv")
## Parsed with column specification:
## cols(
##   Year = col_integer(),
##   Location = col_character(),
##   `number of visitors` = col_integer()
## )
TW92 <- arrange(TW92,desc(`number of visitors`))
top10_TW92 <- TW92 [c(2,3,4,6,7,8,9,11,13,15),]

TW91 <- read_csv("C:/Users/user/Desktop/R/Final Project/TW 86-105/TW91.csv")
## Parsed with column specification:
## cols(
##   Year = col_integer(),
##   Location = col_character(),
##   `number of visitors` = col_integer()
## )
TW91 <- arrange(TW91,desc(`number of visitors`))
top10_TW91 <- TW91 [c(2,3,4,6,7,8,10,11,12,13),]

TW90 <- read_csv("C:/Users/user/Desktop/R/Final Project/TW 86-105/TW90.csv")
## Parsed with column specification:
## cols(
##   Year = col_integer(),
##   Location = col_character(),
##   `number of visitors` = col_integer()
## )
TW90 <- arrange(TW90,desc(`number of visitors`))
top10_TW90 <- TW90 [c(2,3,4,6,7,8,10,11,12,13),]

TW89 <- read_csv("C:/Users/user/Desktop/R/Final Project/TW 86-105/TW89.csv")
## Parsed with column specification:
## cols(
##   Year = col_integer(),
##   Location = col_character(),
##   `number of visitors` = col_integer()
## )
TW89 <- arrange(TW89,desc(`number of visitors`))
top10_TW89 <- TW89 [c(2,3,5,6,7,8,11,12,13,14),]

TW88 <- read_csv("C:/Users/user/Desktop/R/Final Project/TW 86-105/TW88.csv")
## Parsed with column specification:
## cols(
##   Year = col_integer(),
##   Location = col_character(),
##   `number of visitors` = col_integer()
## )
TW88 <- arrange(TW88,desc(`number of visitors`))
top10_TW88 <- TW88 [c(2,3,5,6,8,9,10,12,13,14),]

TW87 <- read_csv("C:/Users/user/Desktop/R/Final Project/TW 86-105/TW87.csv")
## Parsed with column specification:
## cols(
##   Year = col_integer(),
##   Location = col_character(),
##   `number of visitors` = col_integer()
## )
TW87 <- arrange(TW87,desc(`number of visitors`))
top10_TW87 <- TW87 [c(2,4,5,6,8,9,10,12,13,14),]

TW86 <- read_csv("C:/Users/user/Desktop/R/Final Project/TW 86-105/TW86.csv")
## Parsed with column specification:
## cols(
##   Year = col_integer(),
##   Location = col_character(),
##   `number of visitors` = col_integer()
## )
TW86 <- arrange(TW86,desc(`number of visitors`))
top10_TW86 <- TW86 [c(2,4,5,7,8,9,10,11,12,14),]

top10_TW <- rbind(top10_TW86,top10_TW87,top10_TW88,top10_TW89,top10_TW90,top10_TW91,top10_TW92,top10_TW93,top10_TW94,top10_TW95,top10_TW96,top10_TW97,top10_TW98,top10_TW99,top10_TW100,top10_TW101,top10_TW102,top10_TW103,top10_TW104,top10_TW105)

Step 2. 畫成圖來觀察

民國86年-105年(1997-2016) 台灣人最常去的地方前十名 (註:本資料已去除「未列名」的部分)

library(readr)
library(dplyr)
library(knitr)
## Warning: package 'knitr' was built under R version 3.4.3
TOP10_TW <- data.frame (c(top10_TW86$Location),c(top10_TW87$Location),c(top10_TW88$Location),c(top10_TW89$Location),c(top10_TW90$Location),c(top10_TW91$Location),c(top10_TW92$Location),c(top10_TW93$Location),c(top10_TW94$Location),c(top10_TW95$Location),c(top10_TW96$Location),c(top10_TW97$Location),c(top10_TW98$Location),c(top10_TW99$Location),c(top10_TW100$Location),c(top10_TW101$Location),c(top10_TW102$Location),c(top10_TW103$Location),c(top10_TW104$Location),c(top10_TW105$Location))
TOP10_TW <- t(TOP10_TW)
rownames(TOP10_TW) = 86:105
colnames(TOP10_TW) = 1:10
kable(TOP10_TW)
1 2 3 4 5 6 7 8 9 10
86 香港 日本 美國 澳門 泰國 新加坡 馬來西亞 印尼 菲律賓 越南
87 香港 日本 美國 澳門 泰國 新加坡 馬來西亞 菲律賓 印尼 越南
88 香港 澳門 日本 美國 泰國 馬來西亞 新加坡 加拿大 越南 印尼
89 香港 澳門 日本 美國 泰國 馬來西亞 新加坡 印尼 越南 加拿大
90 香港 澳門 日本 泰國 美國 馬來西亞 印尼 新加坡 越南 加拿大
91 香港 澳門 日本 美國 泰國 印尼 越南 新加坡 馬來西亞 加拿大
92 香港 澳門 日本 美國 泰國 印尼 越南 韓國 新加坡 馬來西亞
93 香港 日本 澳門 美國 泰國 韓國 印尼 越南 馬來西亞 新加坡
94 香港 日本 澳門 美國 韓國 泰國 越南 印尼 新加坡 馬來西亞
95 香港 澳門 日本 美國 韓國 泰國 越南 新加坡 印尼 馬來西亞
96 香港 日本 澳門 美國 韓國 泰國 越南 印尼 新加坡 馬來西亞
97 香港 日本 澳門 美國 韓國 泰國 越南 中國大陸 印尼 新加坡
98 香港 中國大陸 日本 澳門 美國 韓國 越南 泰國 印尼 馬來西亞
99 中國大陸 香港 日本 澳門 美國 韓國 泰國 越南 馬來西亞 印尼
100 中國大陸 香港 日本 澳門 韓國 美國 泰國 越南 印尼 馬來西亞
101 中國大陸 香港 日本 韓國 澳門 美國 越南 泰國 新加坡 菲律賓
102 中國大陸 日本 香港 韓國 澳門 泰國 美國 越南 新加坡 馬來西亞
103 中國大陸 日本 香港 韓國 澳門 美國 泰國 越南 新加坡 馬來西亞
104 日本 中國大陸 香港 泰國 澳門 韓國 美國 越南 新加坡 馬來西亞
105 日本 中國大陸 香港 韓國 澳門 泰國 美國 越南 新加坡 馬來西亞

民國86年-105年(1997-2016) 台灣人最常去的地方人數變化圖 (註:本資料已去除「未列名」的部分)

library(ggplot2)
## Warning: package 'ggplot2' was built under R version 3.4.2
library(plotly)
## Warning: package 'plotly' was built under R version 3.4.2
## 
## Attaching package: 'plotly'
## The following object is masked from 'package:ggplot2':
## 
##     last_plot
## The following object is masked from 'package:stats':
## 
##     filter
## The following object is masked from 'package:graphics':
## 
##     layout
gp=ggplot(top10_TW,mapping = aes(x=Year, y=`number of visitors`))+
    geom_line(mapping = aes(color=Location))+
    scale_x_continuous(limits=c(86,105) ,breaks=86:105)+
    scale_y_continuous(breaks=seq(0, 5000000, by=500000))+
    labs(title = "86-105 台灣人最常去的地方")
    
ggplotly(gp)
## We recommend that you use the dev version of ggplot2 with `ggplotly()`
## Install it with: `devtools::install_github('hadley/ggplot2')`

觀察與發現:

民國96年(2007)以前,台灣每年去中國的人數,甚至沒有在前十名。

97年(2008)開始成為第8名(約18萬人)後,從98年(2009)開始,去中國的人數(約151萬人)暴增,相對的去港、澳的人數下降。


猜測可能原因:兩岸開放直飛


說明:

過去因為兩岸政治敏感因素,並未開放兩岸直航,有許多因為工作因素需要前往中國的台灣人,大多會飛到香港後,再去中國。從香港到中國,不一定是飛機(例如若去深圳,通常會選擇從香港搭小巴去),且不一定在到香港的同一天又前往中國。所以儘管最終目的地是中國,從台灣的出境資料看起來仍會是香港。

  • “2002年12月4日,中華民國政府通過《大陸台商春節返鄉專案》規定: 只允許台灣民航業者申請在春節期間,以包機方式運載台商返台 包機出發航點只限台北和高雄,抵達機場只限上海浦東國際機場或虹橋機場 包機來回均須在香港或澳門作為中途停站,不准在中途站上下客 乘客只能是台商及其眷屬”

[補充說明]
包機指的是「非定期班機」,租戶與機主訂立出租合約。包機的乘客即為租戶,除了客運包機之外,還有貨運包機。
主要包機客戶通常為:旅行社、大型企業、軍隊、救援隊、尚未簽定航約的兩地(兩岸在尚未簽定定期航約前,先以包機的形式在兩岸間載送旅客)等。
  • 2003年開始,開放在春節時段,專案容許台灣的航空公司航機,以定點、定時、定對像方式,專程接載台商往返上海和台北。(2003年1月26日,54年來中華民國航機首次合法降落大陸地區)

  • 不過隔年(2004年)因為陳水扁連任統統後,中國因政治因素考量,停止春節包機的協議。2005年才又恢復。

  • 2006年開始,春節包機乘客對象擴張到持合法證件的台灣居民

  • 2008年算是個重要的轉捩點,5月12日四川發生汶川大地震,地震發生後台政府為順利讓在四川的台灣旅客盡速返台,而積極向大陸方面協商。最終達成協議,由長榮、華航、復興、華信於5月16日以包機的模式由台灣方面派出四個架次的飛機分別自成都和重慶的機場搭載旅客返台。

  • 同年的6月13日(馬英九當選總統後),兩岸經過協商,決定開始兩岸週末包機,每週五到週一有18個航次飛行。與先前的直航包機不同的是,兩岸所有合法旅客皆可乘機往返

  • 同年12月15日,兩岸實現真正直航(開放兩岸平日包機),同時實現常態包機。

  • 2009年8月31日,開通兩岸定期航班,班次增加至雙方合計每週270班,大陸航點亦增加至27個。

觀察97-99的台灣前往東亞地區(亦為前5名)的月資料

library(readr)
library(dplyr)
`2008M` <- read_csv("C:/Users/user/Desktop/R/Final Project/2008-2010 Month/2008M.csv")
## Parsed with column specification:
## cols(
##   Year = col_integer(),
##   Month = col_integer(),
##   香港 = col_number(),
##   中國大陸 = col_number(),
##   澳門 = col_number(),
##   日本 = col_number(),
##   韓國 = col_number()
## )
`2009M` <- read_csv("C:/Users/user/Desktop/R/Final Project/2008-2010 Month/2009M.csv")
## Parsed with column specification:
## cols(
##   Year = col_integer(),
##   Month = col_integer(),
##   香港 = col_number(),
##   中國大陸 = col_number(),
##   澳門 = col_number(),
##   日本 = col_number(),
##   韓國 = col_number()
## )
`2010M` <- read_csv("C:/Users/user/Desktop/R/Final Project/2008-2010 Month/2010M.csv")
## Parsed with column specification:
## cols(
##   Year = col_integer(),
##   Month = col_integer(),
##   香港 = col_number(),
##   中國大陸 = col_number(),
##   澳門 = col_number(),
##   日本 = col_number(),
##   韓國 = col_number()
## )
m2008 <- read_csv("C:/Users/user/Desktop/R/Final Project/2008-2010 Month/m2008.csv")
## Parsed with column specification:
## cols(
##   Location = col_character(),
##   Month = col_integer(),
##   `number of visitors` = col_number()
## )
m2009 <- read_csv("C:/Users/user/Desktop/R/Final Project/2008-2010 Month/m2009.csv")
## Parsed with column specification:
## cols(
##   Location = col_character(),
##   Month = col_integer(),
##   `number of visitors` = col_number()
## )
m2010 <- read_csv("C:/Users/user/Desktop/R/Final Project/2008-2010 Month/m2010.csv")
## Parsed with column specification:
## cols(
##   Location = col_character(),
##   Month = col_integer(),
##   `number of visitors` = col_number()
## )
m2008_2010 <- read_csv("C:/Users/user/Desktop/R/Final Project/2008-2010 Month/m2008_2010.csv")
## Parsed with column specification:
## cols(
##   Location = col_character(),
##   Month = col_character(),
##   `number of visitors` = col_number()
## )
m08_10 <- read_csv("C:/Users/user/Desktop/R/Final Project/2008-2010 Month/m08_10.csv")
## Parsed with column specification:
## cols(
##   Location = col_character(),
##   Month = col_integer(),
##   `number of visitors` = col_number()
## )
m12_17 <- read_csv("C:/Users/user/Desktop/R/Final Project/2012-2017 Month/m12_17.csv")
## Warning: Missing column names filled in: 'X5' [5], 'X6' [6], 'X7' [7],
## 'X8' [8], 'X9' [9], 'X10' [10], 'X11' [11], 'X12' [12], 'X13' [13],
## 'X14' [14], 'X15' [15], 'X16' [16], 'X17' [17]
## Parsed with column specification:
## cols(
##   Year = col_character(),
##   Month = col_integer(),
##   Location = col_character(),
##   `number of visitors` = col_number(),
##   X5 = col_character(),
##   X6 = col_character(),
##   X7 = col_character(),
##   X8 = col_character(),
##   X9 = col_character(),
##   X10 = col_character(),
##   X11 = col_character(),
##   X12 = col_character(),
##   X13 = col_character(),
##   X14 = col_character(),
##   X15 = col_character(),
##   X16 = col_character(),
##   X17 = col_character()
## )
newm2012_2017 <- read_csv("C:/Users/user/Desktop/R/Final Project/2012-2017 Month/newm2012_2017.csv")
## Warning: Missing column names filled in: 'X5' [5], 'X6' [6], 'X7' [7],
## 'X8' [8], 'X9' [9], 'X10' [10], 'X11' [11], 'X12' [12], 'X13' [13],
## 'X14' [14], 'X15' [15], 'X16' [16]
## Parsed with column specification:
## cols(
##   Year = col_character(),
##   Month = col_character(),
##   Location = col_character(),
##   `number of visitors` = col_number(),
##   X5 = col_character(),
##   X6 = col_character(),
##   X7 = col_character(),
##   X8 = col_character(),
##   X9 = col_character(),
##   X10 = col_character(),
##   X11 = col_character(),
##   X12 = col_character(),
##   X13 = col_character(),
##   X14 = col_character(),
##   X15 = col_character(),
##   X16 = col_character(),
##   小計 = col_number()
## )
library(ggplot2)
library(plotly)
gp=ggplot(m2008,mapping = aes(x=Month, y=`number of visitors`))+
    geom_line(mapping = aes(color=Location))+
    scale_x_continuous(limits=c(1,12) ,breaks=1:12)+
    scale_y_continuous(breaks=seq(0, 300000, by=20000))+
    labs(title = "民國97年(2008) 台灣人前往東亞地區月資料")
ggplotly(gp)
## We recommend that you use the dev version of ggplot2 with `ggplotly()`
## Install it with: `devtools::install_github('hadley/ggplot2')`
gp=ggplot(m2009,mapping = aes(x=Month, y=`number of visitors`))+
    geom_line(mapping = aes(color=Location))+
    scale_x_continuous(limits=c(1,12) ,breaks=1:12)+
    scale_y_continuous(breaks=seq(0, 300000, by=20000))+
    labs(title = "民國98年(2009) 台灣人前往東亞地區月資料")
ggplotly(gp)
## We recommend that you use the dev version of ggplot2 with `ggplotly()`
## Install it with: `devtools::install_github('hadley/ggplot2')`
gp=ggplot(m2010,mapping = aes(x=Month, y=`number of visitors`))+
    geom_line(mapping = aes(color=Location))+
    scale_x_continuous(limits=c(1,12) ,breaks=1:12)+
    scale_y_continuous(breaks=seq(0, 300000, by=20000))+
    labs(title = "民國99年(2010) 台灣人前往東亞地區月資料")
ggplotly(gp)
## We recommend that you use the dev version of ggplot2 with `ggplotly()`
## Install it with: `devtools::install_github('hadley/ggplot2')`
#gp=ggplot(m08_10,mapping = aes(x=Month, y=`number of visitors`))+
    #geom_line(mapping = aes(color=Location))+
    #scale_x_continuous(limits=c(1,36) ,breaks=1:36)+
    #scale_y_continuous(breaks=seq(0, 300000, by=20000))+
    #labs(title = "民國97-99年(2008-2010) 台灣人前往東亞地區月資料")
#ggplotly(gp)

mlabels=unique(m2008_2010$Month)
m2008_2010$Month = factor(m2008_2010$Month, labels=mlabels, ordered=T)

gp=ggplot(m2008_2010,mapping = aes(x=Month, y=`number of visitors`, group=Location))+
    # geom_line() + 
    geom_line(mapping = aes(color=Location))+
    #scale_x_continuous(limits=c(1,36) ,breaks=1:36)+
    scale_y_continuous(breaks=seq(0, 300000, by=20000))+
    labs(title = "民國97-99年(2008-2010) 台灣人前往東亞地區月資料")+
    theme(axis.text.x = element_text(angle = 90, hjust = 1))
ggplotly(gp)
## We recommend that you use the dev version of ggplot2 with `ggplotly()`
## Install it with: `devtools::install_github('hadley/ggplot2')`

觀察與發現:

[重要時間點review]

民國97年(2008)6月:開始兩岸週末包機

民國97年(2008)12月:開始兩岸平日包機

民國98年(2009)9月:開始兩岸定期航班


觀察2008-2010的月資料,可以發現台灣人去中國大陸的人數,增長的幅度最明顯的是在2009年,尤其將三年的月資料合在一起看之後,2008年12月到2009年2月有非常驚人的成長。

除了可能受春節影響(許多台商或其親屬需要往返兩邊)外,跟2008年12月開始開放的「兩岸平日包機」,看起來也有很大的關係。雖然春節效應過了之後,單月前往大陸的人數大幅下降,但仍遠高於前一年同月的人數(以五月來說,97年人數是96的5.33倍)。

在2009年9月開放「兩岸定期航班」後,前往中國大陸的人數更是頻頻增高。


那到底為什麼會增加這麼多的人去中國大陸? 而這些人又去中國大陸做了什麼呢?

猜測可能原因:(1)台商不透過香港直接進中國大陸 (2)因為成本下降,所以台商更頻繁前往中國大陸。 (3)因為更方便,所以前往中國大陸旅遊人數增加。 (4)因為政策及社會氛圍,兩岸往來更加頻繁。


讓我們進一步來觀察~

觀察過去五、六年台灣最常去的地區月資料

library(ggplot2)
library(plotly)

mlabels=unique(newm2012_2017$Month)
newm2012_2017$Month = factor(newm2012_2017$Month, labels=mlabels, ordered=T)

gp=ggplot(newm2012_2017,mapping = aes(x=Month, y=`number of visitors`, group=Location))+
    geom_line(mapping = aes(color=Location))+
    scale_y_continuous(breaks=seq(0, 450000, by=30000))+
    labs(title = "民國101-106年(2012-2017) 台灣人最常前往的地區月資料")+
    theme(axis.text.x = element_text(angle = 90, hjust = 1))
ggplotly(gp)
## We recommend that you use the dev version of ggplot2 with `ggplotly()`
## Install it with: `devtools::install_github('hadley/ggplot2')`

觀察與發現:

從這張圖,我們可以看到很多東西。

首先,讓我們先接續著前面的問題,來看看從101年(2012)到目前台灣人前往中國大陸的人數月資料變化。我們可以發現到一年當中,前往中國大陸的人數高峰約在2月、7月、10月。其中,7月、10月為雙高峰、2月為次高。

把這個pattern跟台灣最愛去的日本來比,可以很明顯的發現,7月、10月亦是台灣人前往日本最多人數的時候,但顯然7月最多、10月是次高,2月並沒有特別多人前往,反而是4、5月可以看到有較多的人前往(可能是因為花季的關係)。

因此,我們可以合理推斷出,增加的人數幅度,有顯著的原因來自台商(考量台灣的過節文化)。而對照前往香港的人數月資料,可以看見去香港的人數下降幅度並沒有去中國大陸的人數增加幅度來的高。故,我們可以推斷,前面的猜測(2)較猜測(1)合理。

此外,7月在2008-2010的那張圖中,並沒有在高峰,跟近年的結果比起來(7月最多人去),顯然前往旅遊的人數大幅增加也是造成整體前往中國大陸人數的成長的主因。故猜測(3)應該是成立的。

至於猜測(4),我想和大家分享一些我從高中到大學的小小觀察。(因非嚴謹的證據,故採口述)

其他可以從這張圖看到的東西~

[台灣人的旅遊Pattern……]

In general, 台灣的出國人數高峰與寒暑假(2,7月)有高度相關,再來10月通常有個小高峰。

有明顯淡旺季的:

日本 → 旺季:4,7,10月 (通常7月最多);淡季:12月 (穩定成長)

中國 → 旺季:2,7,10月 (通常7月最多);淡季:1月 (在101年後,成長趨緩)

香港 → 高低起伏與中國大致相同、高度相關

泰國 → 旺季:2,6,9月

美國 → 旺季:1,7月

新加坡、馬來西亞、越南 → 旺季:2,7月

<待做部分>

前往中國大陸的人的年齡層,以及前往原因。 2008-now 大陸月資料